Governing Trust in Health AI: A Qualitative Study of Cybersecurity Professionals Perspectives
这项基于社会技术系统理论的研究通过对 20 名网络安全专业人士的定性访谈,揭示了医疗人工智能的公信力并非仅取决于技术性能,而是依赖于通过可见问责制和持续治理来构建的制度信任。
193 篇论文
这项基于社会技术系统理论的研究通过对 20 名网络安全专业人士的定性访谈,揭示了医疗人工智能的公信力并非仅取决于技术性能,而是依赖于通过可见问责制和持续治理来构建的制度信任。
该研究表明,源自高收入国家的医疗大语言模型在低中收入国家(LMIC)的呼吸道疾病诊断中表现出显著偏差,其建议的确诊范围比当地医生更窄,且这种偏差在模型知晓地理位置后依然存在,主要源于高收入国家的流行病学特征。
本文提出了 GEN-KnowRD 框架,通过将大语言模型重新定位为知识层构建工具而非直接诊断推理引擎,成功生成了可计算的罕见病知识库(PheMAP-RD),从而在多个基准测试和真实世界队列中显著提升了罕见病识别与早期筛查的准确性及可扩展性。
该研究证实,利用随机森林、CatBoost 和可解释增强机等机器学习算法,结合电子病历中的情境特征,能够有效检测儿童急性病毒性咽炎治疗中的绝对不合理临床变异,且弱标签训练模型表现与金标准相当,为无需集中数据分析的可扩展变异检测提供了新途径。
该研究提出了一种基于真实世界电子病历的框架,通过整合放射学进展证据重建多线治疗序列并生成个体化无进展生存期预测,从而有效解决了转移性乳腺癌后线治疗风险分层中指南证据匮乏及数据非结构化的挑战。
本文提出了 PhenoSS,一种基于高斯 copula 的统计框架,通过建模人类表型本体(HPO)术语的边际患病率及其联合依赖关系并校正批次效应,实现了更精准的罕见病预测和患者聚类。
该论文提出了名为 RareDAI 的集成方法,通过自蒸馏微调技术使大语言模型能够利用思维链解析临床指南和异构数据,从而在罕见病基因检测决策中提供可解释的推理并显著优于传统模型。
本文提出了一种结合解剖学引导的质子 MRI 与代谢引导的钠 MRI 的 DIP-Fusion 框架,通过方向全变分正则化有效解决了钠 MRI 信噪比低和扫描时间长的问题,显著提升了加速采集下的图像重建质量与临床可行性。
该研究表明,尽管当前通用大语言模型在反驳疫苗谣言方面表现出高度的科学准确性和事实纠正能力,但其输出内容的语言复杂性和对提示语框架的敏感性可能限制公众的可及性,因此需结合透明来源和可读性优化将其整合至公共卫生渠道。
该研究评估了利用大语言模型对临床医生修改环境 AI 生成的病历草稿进行句子级分类的可行性,发现通过提示工程可有效识别药物和症状等明确类别的编辑,但在处理复杂或边界模糊的编辑时更适合作为人工审查的筛选工具。
这项在荷兰学术医疗中心进行的研究评估了 Epic 生成式 AI 工具在患者消息回复中的实施效果,发现尽管初期采用率较高且存在时间节省等积极因素,但实际对临床效率、幸福感及工作量的改善有限,且随着时间推移采用率和用户满意度显著下降,凸显了明确工具定位、管理用户期望及建立质量指标对于负责任推广的重要性。
本文提出了一种将临床理论显式融入架构设计的深度学习模型,通过解构社交与运动特征并利用结构化跨模态注意力机制,实现了可解释且性能领先的自闭症严重程度预测。
该综述指出,2025 年医疗人工智能研究发表量近乎翻倍,领域正从传统机器学习向多模态基础模型加速演进,标志着 AI 研究从探索性开发迈向更贴近复杂临床实践的真实世界应用成熟阶段。
该研究利用来自美国大型安全网医疗系统的 35 万余例心力衰竭住院数据,证实了通过深度特征合成(DFS)进行的自动化特征工程能显著提升梯度提升树模型在预测 30 至 90 天再入院风险时的判别力、校准度及临床实用性,但其效果具有显著的模型依赖性。
这项队列研究表明,期刊针对学术不端问题发布的不同类型的编辑回应(如编辑通知、关注声明或撤稿)并未导致被引用率出现显著差异,其下降趋势与未受影响的对照组相似,且迟发的编辑通知未能有效阻止后续引用。
该研究提出了一种基于治理驱动和真实世界数据校准的健康信息学框架,通过整合纵向患者流建模、持久性暴露估算及多源校准,显著提升了肿瘤及复杂慢性病领域医疗利用预测的准确性,有效克服了传统静态市场份额模型在捕捉治疗序列、复发再入及医生采纳动态等方面的局限性。
本文提出了名为 SO_SCPLOWTRATC_SCPLOWCP 的分层共形框架,通过控制假阳性率并针对剩余患者提供校准的延迟预测集,将医学基础模型转化为在明确错误预算下安全部署的决策策略,从而在眼科和神经肿瘤学等任务中实现临床安全与资源效率的平衡。
该研究评估了 15 个可本地部署的医疗大语言模型,发现模型规模和医学微调并非临床鲁棒性的可靠指标,其表现显著受术语复杂度和子领域影响,因此安全部署需针对具体用例进行验证。
该研究通过智能戒指和睡眠日记数据评估发现,睡眠规律性问卷(SRQ)仅与日记记录的睡眠时间变异性和感知睡眠质量存在中等程度的相关性,而与智能戒指测得的客观睡眠规律性指标关联微弱,表明其在健康成人中更适合作为客观监测的补充而非替代工具。
这项随机对照试验表明,利用大语言模型将放射学报告简化至中学阅读水平,在保持极低幻觉率的同时显著提升了患者的报告可读性与理解度,且绝大多数患者支持将其纳入未来临床实践。